MMSkills: Hacia habilidades multimodales para agentes visuales generales
<meta name=description content=Explora las habilidades multimodales que permiten a los agentes visuales generales entender y actuar en el mundo real mediante la integración de visión, lenguaje y más.>